AI 应用之路:质疑汤姆猫,成为汤姆猫,超越汤姆猫
The following article is from AI大航海 Author 吴炳见
汤姆猫是移动互联网时代的典型应用代表,凭借硬件或者系统的新功能,迅速出一个有一定可玩性但没有长期留存的会蹭上热度的 app。而在当下的 AGI 时代,也有很多类似汤姆猫的应用,但要不要做汤姆猫,以及如何看待汤姆猫,心资本 Soul Capital 合伙人吴炳见提出了自己的看法。
或许,理解汤姆猫,才有可能真正超越汤姆猫。
作者介绍:吴炳见,心资本 Soul Capital 合伙人,三年百度 mobile 产品经理+战略分析经验,十年风险投资经验,之前就职于险峰和联想之星。重点投资 AI、机器人、硬件行业。
过去一年,我对 AI 应用的看法经历了这样一个过程:质疑汤姆猫,理解汤姆猫,成为汤姆猫,超越汤姆猫。
什么是汤姆猫?汤姆猫是 2010 年移动互联网早期的一款应用,迅速走红,又淡出视野。这是一个比喻,指代那些很好玩,一度成为现象级,但没有长期留存的产品。拍出海马体的妙鸭相机,让郭德纲说英文相声的 Heygen,都有点 AI 时代汤姆猫的意思。
坦率讲,最开始我是质疑汤姆猫的,这类产品一度热闹,但玩法单一,没有长期留存率,很难持续。在我写的《今天的AI创业,与移动互联网时代的区别在哪里?》中,有一段对汤姆猫的讨论:
一个平台从 1 岁走到黄金年龄,会经历很多真伪机会。回头看移动互联网的早期,有四类机会都曾霸榜。
……
第二类机会叫「汤姆猫」,是小机会。汤姆猫很巧妙的用到了手机的麦克风,你说什么话,它就会用猫的语气来复述。当时日下载量到了百万级别,但没有长期留存率,因为玩法单一,和猫对话几天后就没有新鲜感了。后来汤姆猫被中国的一家上市公司收购了,作价 70 亿人民币。
今天在 AI 的早期阶段,摆在我们眼前的依然是这四类机会,我们需要想清楚,谁是 AI 时代的手电筒,谁是 AI 时代的抖音快手。基于大模型的套壳应用是新时代的手电筒,很短的时间就会被大模型的能力击穿;基于 AI 做出的一些原生小爆款应用,如果玩法过于单一,无法形成自己的资产,很可能成为新时代的汤姆猫;
后来为什么理解汤姆猫了?因为更理解大模型的能力边界,和当下所处的阶段了。
理解汤姆猫,
是因为理解了当下大模型的能力边界
大模型的发展规律和互联网有很大差异,更应该参照芯片行业的发展规律。
50 年代,仙童发明了半导体后,随着芯片能力的提升,先后出现了计算器、PC、游戏机、移动手机、MP3、智能手机这些国民级的电子产品,这背后是摩尔定律的推动,「处理器的性能每两年翻一倍,价格下降为之前的一半」。
这些电子产品横跨几十年,依次解锁,半导体刚出来的时候,它的能力只能用来做计算器,随着计算能力的提升,才能造出 PC。
OpenAI 推出 ChatGPT 只有一年多时间,基于大模型的应用的出现也是有先后顺序的,在要出计算器、随身听的时候,不要硬造 PC;在要出汤姆猫的时候,不要硬造抖音,造不出来。历史无法跳跃,只能经历。
Scaling Law 会成为 AI 时代的摩尔定律,堆算力,堆参数。随着模型能力的提升,基于大模型不是造应用,而是造虚拟人,起初是本科生,之后是白领,之后是某些领域的专家比如医生、律师,后面会造出科学家,最终极的形态是 AGI,随着模型智能程度的提升,这些虚拟人会依次解锁。
以造人的标准来看待当下大模型的能力,就知道需要多少智能,和中间的差距了。
而现在我们常说的「AIGC 应用」,可能只是 AI 发展史上的过渡阶段,是因为当下的模型还造不出虚拟人,所以先造辅助软件。
成为前千分之一的汤姆猫,
完成能力蜕变
理解汤姆猫后,我认为应该尽快「成为汤姆猫」,且做前千分之一的汤姆猫。
这缘于我的一个观察。
和很多投过的早期项目相处后,我发现创始人的能力不是线性增长,而是跳变的,忽然之间上了很大一个台阶,可能就一个月时间,隔壁老王已经不是我认识的老王,我得管他叫王哥了。
发生跳变的时间点往往和 PMF 跑通有关系,跑通后,整个人的思考水平、决策的犀利程度、心态的平稳度都有一个质变,再之后,就和业务量爬到几层楼相关了,月收入 1000 万、月收入 1 亿、月收入 10 亿是完全不同的思考水平,爬楼的中间,会有很多正负反馈,往往深刻又惨痛,反馈越大,能力跳变越明显。这才有了士别三日当刮目相看的感觉。
这让我明白了一个朴素的道理,产品是创始人的实验室,首先要跑通 PMF,让自己有个实验室,哪怕这个实验室小了点。
然后要寻找更大的实验室,基于 10 万日活和 1 亿日活能做的实验是不一样的,一个人天天基于几亿日活做商业实验,他的水平能不高吗?为什么一些平台级产品的大佬思考水平极高,像开了天眼一样,因为他有几个亿的用户啊。
人人都想做有终局的产品,做下一个微信和抖音,但别忘了,张小龙是做 Foxmail 被腾讯收购的,Foxmail 是个邮件客户端,是那个年代最知名的套壳应用了。
基于这一观察,和 AI 现在所处的极早期阶段,在寻找 PMF 的时候,先不要嫌弃它是汤姆猫,找个具体且收敛的切入点,跑通它,让自己有个实验室,先完成能力跳变。
AI 和移动互联网的差异,远大于移动互联网和互联网的差异,先跳下来,刷一遍自己的 ROM 很重要。在 AI 这个全新的世界中,大多数人是从头学,今年完成能力跳变,还是明年完成能力跳变,会遇到截然不同的机遇。
但即便以汤姆猫的标准看 AI 应用,只求爆款,不苛求留存率,也只有前千分之一的产品能成汤姆猫。
超越汤姆猫,
才有机会成为 Super App
前千分之一的选手成为汤姆猫后,会面临两个选择:
一是基于汤姆猫继续绣花,迭代产品,希望做出长期留存,这很难,因为这个产品的地基很薄,就是绣花绣上天,也是个绣花版汤姆猫,基于汤姆猫建成一个迪斯尼娱乐王国是不现实的。
二是通过做汤姆猫实现了团队能力升级,走出汤姆猫,去做新的事情。人站在一层楼和一百层楼看到的机会是不一样的,做过十亿的业务,自然会发现百亿业务的机会,这或许会找到更厚的地基,做出 super App。这是所谓的「超越汤姆猫」。
选一还是选二,是一道分水岭。很多耳熟能详的平台级产品,初创时都有过类似汤姆猫的阶段,又推出新产品超越了汤姆猫。
2012 年 3 月,字节跳动成立,先推出的是内涵段子,同年 8 月推出了今日头条,2016 年 9 月,抖音上线。
2015 年 4 月,拼好货上线,做的是拼团买水果,同年 9 月,拼多多上线,切到了电商的主战场,2022 年 9 月,Temu 上线,开始海外的征程。
2010 年 3 月,美团团购上线,2013 年 11 月,美团外卖上线,2015 年 10 月,美团合并大众点评,从交易平台延伸到了信息平台。
好了,即便我们懂了「超越汤姆猫」这个道理,依然难过好这一生。
绝大多数情况下,人们很难大大方方承认自己是个汤姆猫,面对低留存率、低商业价值的时候,会做很多设想,是不是自己功能不够完善?是不是用户数量不够多?是不是应该把汤姆猫升级成社交产品,就有网络效应了?这种事情在移动互联网发生过很多了,做日历的、做滤镜的、做小游戏的,都有过平台梦。
「成为汤姆猫」是块石头,用好了可以踩着石头过河,实现「超越汤姆猫」;用不好是阻拦前行的巨石,做一辈子的汤姆猫。
Scaling Law 会成为 AI 时代的摩尔定律
上面是从质疑到成为的心路历程,也是感受当下,认清当下,抓住当下的过程。
那么更具体的聊聊当下,现在处于什么 timing,会推演出哪些信号?
最关键的信号,Scaling Law 会成为AI时代的摩尔定律,模型的智能程度每年增长百分之 X,价格降为之前的 1/N,现在还只有一个定性的描述,当 X 和 N 都成为一个定量数字的时候,这个规律就开始正式运转了。
Scaling Law 会把模型送上一个个新高度,从而会依次解锁上层应用,也就是造人。这些虚拟人需要替代真人,端到端的完成任务,做到「L4 级别」。在真实工作环境中,我们 90% 的时间是在解决那 10% 的难题,大模型能否解决好那 10% 的难题是一道及格线,过不了这个及格线,大模型只能做副驾 copilot,充其量是一个好用的软件;过了这个及格线,大模型就是主驾,我们开始为主驾付工资。
基于造人的标准,需要有一套图灵测试 2.0。在 ChatGPT 出来后,模型已经通过图灵测试 1.0,接近人的回答水平,以假乱真了。图灵测试 2.0 是一套基于工种的测试,比如文案策划、剧本杀小姐姐、程序员、医生,如果这个虚拟程序员能听懂你的需求、写出完整代码、修正 bug,那他就通过程序员图灵测试了。当下的大模型基本通过剧本杀小姐姐的图灵测试了,大家在 Character.ai、星野这些应用上和 AI 聊的很欢。
如果以图灵测试 2.0 来衡量当下的 AI Agent,真正的 Agent 尚未出现,真正意义上的 Agent 是可以自己规划任务,端到端的完成任务的。
如果第一个 Agent 出现,大概率是出在 OpenAI,因为他有最领先的模型,Agent 的出现主要和模型的智能程度相关,OpenAI 什么时候出 Agent 的 demo 产品,会是应用层百花齐放的关键信号。
基于上面的这些推演,AI 还在很早期的阶段,如果硬要类比互联网的话,此时此刻对应 Yahoo 出现的门户时代。
做 AI 应用的创业者经常半夜问自己,我这应用有网络效应吗?放心,没有。
即便是 ChatGPT 也没有网络效应,只有品牌效应。互联网早期,门户网站也没有网络效应,只有品牌效应,Google 出来后才有了规模效应,Facebook 出来后才有了网络效应。
AI 行业什么时候会有网络效应这种城河?可能是 AI Agent 横行天下的时候,比如我们有个秘书 Agent,帮我们和生意上的伙伴约时间排会,双方的 Agent 一通交流,一握手,约好了!对方的 Agent 也必须是同一厂牌的 Agent,才能最大限度的交流,这就是 AI 时代的网络效应。
多久会发展到这个阶段?很难量化,但不要小看 AI 的进化速度。Sora 出来后,带给我最大的触动是,他比想象中来的快,行业里的人认为 2024 年年底或 2025 年才会出高质量的视频模型,OpenAI 直接在今年 2 月就拿出来了。
对 Sora 的热议,又一次体现了我们总是「高估当下,低估未来」,Sora 还没有公测,大家看到的是精选出来的 demo,在公测后,我估计大概率达不到大家的预期,这时又会出现「不过尔尔」的声音。又过一段时间,Sora 又进化的让人惊讶。
这种冷热交替,去年年初的时候已经在 ChatGPT 上上演过了,先是热议,认为要革命了,然后大家用了一段时间后,觉得还是有局限性,智慧程度不够,上层的杀手级应用也没出现,热议之后是冷静。然后 Sora 横空出世,又带来一波热议,如此往复。
别忘了,不管冷热,Scaling Law 永远在那里,在推动着模型成长。
万物自有其规律,没人能越过 1 到 17 岁,一步到位长到 18 岁。我们都知道 AI 带来的机会大,这是共识了。对当下 timing 的研判、对模型能力边界的理解,还处于非共识,这是真正考验创业者的地方。
人人都想做有终局的产品,望着终局,恨不能省略中间的过程,跳跃中间的历史,直接做最有价值的事情,这是一种我执,忽略了真实世界运转的规律。
而理解汤姆猫、成为汤姆猫、超越汤姆猫,才是真实世界运转的规律,这是一种去执。
去执后,更容易看清当下,抓住当下。浪潮来的时候,关键是要站在海里,且早早学会游泳,早早习惯海水的味道。
世界最强大模型易主!Anthropic发布Claude 3系列模型,幻觉问题更少了
具身智能要来了!OpenAI、英伟达投资,机器人公司Figure AI估值26亿成新独角兽
DeepMind CEO Demis Hassabis 专访:2030年有望达到AGI、AI会带来革命性的全民普惠